AI资讯新闻榜单内容搜索-DeepSeek

超越DeepSeek GRPO的关键RL算法，字节、清华AIR开源DAPO

DeepSeek 提出的 GRPO 可以极大提升 LLM 的强化学习效率，不过其论文中似乎还缺少一些关键细节，让人难以复现出大规模和工业级的强化学习系统。

来自主题: AI技术研报

7240 点击 2025-03-18 17:14

从Manus到MCP：25年AI的三大新趋势

25年开年以来，AI发展如火如荼，DeepSeek R1、OpenAI CUA、Manus等重要创新层出不穷，眼花缭乱。这里我将最近一个月以来的思考总结一下，对25年AI发展趋势做几点预判。

来自主题: AI资讯

7650 点击 2025-03-18 15:00

百度版深度思考模型免费上线！API定价比DeepSeek R1再砍一半

百度文心大模型重磅更新，刚刚如期而至。

来自主题: AI资讯

9616 点击 2025-03-16 15:55

AI进入推理模型时代，一文带你读懂思维链

近段时间，推理模型 DeepSeek R1 可说是 AI 领域的头号话题。用过的都知道，该模型在输出最终回答之前，会先输出一段思维链内容。这样做可以提升最终答案的准确性。

来自主题: AI技术研报

9888 点击 2025-03-16 14:53

OpenAI 提案要求禁用 DeepSeek，呼吁打压中国 AI，彻底暴露双标本质

据外媒 TechCrunch 报道，OpenAI 近日在一项新的政策提案中，将 DeepSeek 描述为被官方资助和控制的实体，并呼吁对该机构及类似机构开发的中国 AI 模型实施禁令。OpenAI 在提案中指出：「虽然目前美国在 AI 领域仍保持领先，但 DeepSeek 的出现表明，这一领先优势并不大，且正在缩小。」

来自主题: AI监管政策

13884 点击 2025-03-14 10:26

长链推理表象下，大模型精细表征张冠李戴的本质

近些年，大模型的发展可谓是繁花似锦、烈火烹油。从 2018 年 OpenAI 公司提出了 GPT-1 开始，到 2022 年底的 GPT-3，再到现在国内外大模型的「百模争锋」，DeepSeek 异军突起，各类大模型应用层出不穷。

来自主题: AI技术研报

11616 点击 2025-03-13 14:41

DeepSeek玩家能提前拿苹果新品！只要15万元，在家跑满血版R1

号称地表最强的M3 Ultra，本地跑满血版DeepSeek R1，效果到底如何？

来自主题: AI资讯

7465 点击 2025-03-13 14:29

刚刚，谷歌Gemma 3上线！单GPU最强多模态手机可跑，27B完胜o3-mini

就在刚刚，谷歌Gemma 3来了，1B、4B、12B和27B四种参数，一块GPU/TPU就能跑！而Gemma 3仅以27B就击败了DeepSeek 671B模型，成为仅次于DeepSeek R1最优开源模型。

来自主题: AI资讯

10265 点击 2025-03-12 18:43

DeepSeek事件「慢思考」——论开源创新的战略价值兼评美国AI扩散框架新规

乙巳新春，中国的推理大模型DeepSeek R1火爆全球。作为一款在推理能力上媲美OpenAI的o1且收费标准远低于o1的国产大模型，DeepSeek一时间在国内刮起一股扑面而来的全民AI风潮，并不令人意外，但这款来自大厂体系外创业团队的开源大模型，经由数位外国商界领袖与技术大佬口碑相传并最终形成在外国新闻媒体上“刷屏”的效果，则是非常耐人寻味了。

来自主题: AI监管政策

13092 点击 2025-03-11 23:53

从「大模型」到「具身智能」，安克深耕前沿技术的另一面藏在这里

前段时间，幻方科技、DeepSeek 创始人梁文锋亲自挂名的一篇论文传遍了全球互联网。

来自主题: AI资讯

7839 点击 2025-03-11 17:11